49 research outputs found

    Apprentissage incrémental pour la détection de chute de personnes ùgées

    No full text
    International audienceDans ce papier, nous proposons une méthodologie d'évolution supervisée d'un modÚle de classification, spécifique à un systÚme de détection de chute de personnes mis au point précédemment. Cette méthodologie met en oeuvre la méthode de détection, un protocole d'apprentissage incrémental ou évolutif, et une méthode d'évaluation et de comparaison des performances, devant conduire à une amélioration des capacités de détection de chutes sur un systÚme embarqué de type caméra intelligente

    Définition et implantation matérielle d'un estimateur de mouvement configurable pour la compression vidéo adaptative

    Get PDF
    L objectif de cette thĂšse est la conception d une plateforme de compression vidĂ©o de nouvelle gĂ©nĂ©ration Ă  haut degrĂ© d adaptation vis-Ă -vis de l environnement. Ce besoin d adaptabilitĂ© a plusieurs origines. D une part les systĂšmes actuels visent Ă  s adapter Ă  la diversitĂ© et l hĂ©tĂ©rogĂ©nĂ©itĂ© des mĂ©dias et des terminaux actuels. D autre part, l exploitation de l information contenue dans une scĂšne vidĂ©o dĂ©pend de l application visĂ©e et des besoins des utilisateurs. Ainsi, l information peut ĂȘtre exploitĂ©e de maniĂšre complĂštement inhomogĂšne spatialement ou temporellement. En effet, l exploitation spatiale de la scĂšne peut ĂȘtre irrĂ©guliĂšre par dĂ©finition, par la dĂ©finition automatique ou manuelle de zones d intĂ©rĂȘts dans l image. La qualitĂ© de la vidĂ©o, donc de la compression, doit pouvoir s adapter afin de limiter la quantitĂ© de donnĂ©e Ă  transmettre. Cette qualitĂ© est donc dĂ©pendante de l Ă©volution de la scĂšne vidĂ©o elle-mĂȘme. Une architecture matĂ©rielle configurable a Ă©tĂ© proposĂ©e dans cette thĂšse permettant de supporter diffĂ©rents algorithmes de recherche en offrant une prĂ©cision subpixĂ©lique.La synthĂšse des travaux menĂ©s dans ce domaine et la comparaison objective des rĂ©sultats obtenus par rapport Ă  l'Ă©tat de l'art. L architecture proposĂ©e est synthĂ©tisĂ©e Ă  base d un FPGA Virtex 6 FPGA, les rĂ©sultats obtenus pourraient traiter l'estimation du mouvement pixĂ©lique avec un flux vidĂ©o haute dĂ©finition (HD 1080), respectivement Ă  13 images par seconde en utilisant la stratĂ©gie de recherche exhaustive (108K Macroblocs/s) et jusqu'Ă  223 images par seconde avec la recherche selon un grille en diamant (1,8 M Macroblocs /s). En outre le raffinement subpixĂ©lique en quart-pel est rĂ©alisĂ© Ă  Macroblocs 232k/ sThe aim of this thesis was to define and implement a hardware architecture of a configurable motion estimation capable of supporting various search strategies with the desired accuracy for adaptive video compression. This need for adaptability had several origins. Firstly, the current systems are designed to adapt to the diversity and heterogeneity of current terminals and media. Secondly, the use of information contained in a video scene depends on the intended applications and user needs. This objective scoring modestly in the challenge offered by the development of digital video requires a faster processing and a high compression ratio.In this thesis, a flexible hardware implementation of the motion estimator which enables the integer motion search algorithms to be modified and the fractional search as well as variable block size to be selected and adjusted. Hence, this novel architecture, especially designed for FPGA targets, proposes high-speed processing for a configuration which supports the variable size blocks and quarter-pelrefinement, as described in H.264. The proposed low-cost architecture based on Virtex 6 FPGA canprocess integer motion estimation on 1080 HD video streams, respectively, at 13 fps using full search strategy (108k Macroblocks/s) and up to 223 fps using diamond search (1.8M Macroblocks/s). Moreover subpel refinement in quarter-pel mode is performed at 232k Macroblocks/sDIJON-BU Doc.Ă©lectronique (212319901) / SudocSudocFranceF

    Détection automatique de chutes de personnes basée sur des descripteurs spatio-temporels (définition de la méthode, évaluation des performances et implantation temps-réel)

    Get PDF
    Nous proposons une méthode supervisée de détection de chutes de personnes en temps réel, robusteaux changements de point de vue et d environnement. La premiÚre partie consiste à rendredisponible en ligne une base de vidéos DSFD enregistrées dans quatre lieux différents et qui comporteun grand nombre d annotations manuelles propices aux comparaisons de méthodes. Nousavons aussi défini une métrique d évaluation qui permet d évaluer la méthode en s adaptant à la naturedu flux vidéo et la durée d une chute, et en tenant compte des contraintes temps réel. Dans unsecond temps, nous avons procédé à la construction et l évaluation des descripteurs spatio-temporelsSTHF, calculés à partir des attributs géométriques de la forme en mouvement dans la scÚne ainsique leurs transformations, pour définir le descripteur optimisé de chute aprÚs une méthode de sélectiond attributs. La robustesse aux changements d environnement a été évaluée en utilisant les SVMet le Boosting. On parvient à améliorer les performances par la mise à jour de l apprentissage parl intégration des vidéos sans chutes enregistrées dans l environnement définitif. Enfin, nous avonsréalisé, une implantation de ce détecteur sur un systÚme embarqué assimilable à une caméra intelligentebasée sur un composant SoC de type Zynq. Une démarche de type Adéquation AlgorithmeArchitecture a permis d obtenir un bon compromis performance de classification/temps de traitementWe propose a supervised approach to detect falls in home environment adapted to location andpoint of view changes. First, we maid publicly available a realistic dataset, acquired in four differentlocations, containing a large number of manual annotation suitable for methods comparison. We alsodefined a new metric, adapted to real-time tasks, allowing to evaluate fall detection performance ina continuous video stream. Then, we build the initial spatio-temporal descriptor named STHF usingseveral combinations of transformations of geometrical features and an automatically optimised setof spatio-temporal descriptors thanks to an automatic feature selection step. We propose a realisticand pragmatic protocol which enables performance to be improved by updating the training in thecurrent location with normal activities records. Finally, we implemented the fall detection in Zynqbasedhardware platform similar to smart camera. An Algorithm-Architecture Adequacy step allowsa good trade-off between performance of classification and processing timeDIJON-BU Doc.électronique (212319901) / SudocSudocFranceF

    Définition et étude des performances d'un détecteur de structures curvilinéaires (application à la stéréoscopie et à la détection d'objets filaires)

    No full text
    Les travaux prĂ©sentĂ©s dans ce manuscrit s inscrivent dans le contexte de la mise en correspondance. En effet nous montrons l intĂ©rĂȘt de rĂ©gions spĂ©cifiques, les rĂ©gions curvilinĂ©aires, dans le cadre des applications de mise en correspondances. Dans cette optique, nous avons dĂ©veloppĂ© un dĂ©tecteur spĂ©cifique aux rĂ©gions curvilinĂ©aires. De plus afin de rĂ©aliser la mise en correspondance des rĂ©gions, un descripteur spĂ©cifique aux rĂ©gions curvilinĂ©aires a Ă©tĂ© dĂ©veloppĂ©. L Ă©valuation du descripteur a Ă©tĂ© rĂ©alisĂ©e en deux temps. Dans un premier temps, nous avons Ă©tudiĂ© et comparĂ© les performances de segmentation du dĂ©tecteur de rĂ©gions curvilinĂ©aires, notamment dans le contexte de la segmentation des veines de la rĂ©tine. Dans un second temps, les performances du dĂ©tecteur (associĂ©s Ă  son descripteur spĂ©cifique) en termes de mise en correspondance ont Ă©tĂ© Ă©valuĂ©es. Cette Ă©tude a Ă©tĂ© menĂ©e en utilisant la mĂ©thode de K. Mikolajczyk, cette mĂ©thodologie permet d obtenir Ă  la fois les performances globales du dĂ©tecteur mais de le comparer avec des dĂ©tecteurs dit standards . Les applications prĂ©sentĂ©es au sein de ce manuscrit sont, elles aussi, de deux types. Dans un premier temps, nous prĂ©sentons deux applications de segmentation qui sont : la dĂ©tection de cordon de colle sur les culasses de moteur avant assemblage ainsi que la dĂ©tection de l aorte dans des coupes sagittales effectuĂ©es Ă  l aide d imageur IRM. Le second type d application est les applications de mise en correspondances. Dans ce champ d application, nous avons proposĂ©s l estimation automatique d homographie.The work presented in this paper falls under the domain of matching. In this context, we try to show the interest of using the curvilinear regions in order to enhance the global performance of various matching applications. A brand new detector for curvilinear regions is introduced (CRD), along with the specific curvilinear regions descriptor (CRD) required. Performance evaluations were done in two parts: First, we evaluated and compared the segmentations performances of our detector, in particular on a retina vessels segmentation application. And second, we estimated the matching performances using K. Mykolajczyk toolkit. This methodology helps obtaining intrinsic performances and comparing them to a so-called standard detectors . We prove our CRD robustness against multiple disruptions e.g. viewpoint change, scaling, luminance factor, JPEG compression effect and blurring effect. Moreover we prove that it can complement the standard detectors with a wide range of considerable information. The presented applications can be summed into two types. At first, we present two segmentation applications: Glue line detection on pre-assembled motor cylinder head, as well as the aorta detection in a sagittal cut using MRI images. The second application type concerns matching operations. For this class of application, we propose an automatic homography estimation.DIJON-BU Sciences Economie (212312102) / SudocSudocFranceF

    Modélisation de visage en temps réel par stéréovision

    No full text
    La perception de la troisiĂšme dimension est rendue possible par diffĂ©rents signaux monoculaires et par la vision binoculaire. L'intĂ©rĂȘt pour la vision binoculaire provient de l'emploi croissant de la troisiĂšme dimension dans les domaines de vision par ordinateurs, de rĂ©alitĂ© virtuelle, de l'infographie ou de la robotique. Les traitements se basent souvent sur la stĂ©rĂ©ovision, technique qui consiste Ă  reconstruire des donnĂ©es en trois dimensions Ă  partir d'acquisitions d'au moins deux prises de vues. Le but principal de ces traitements est de mettre en correspondance les points dans les deux images. Dans le chapitre 1, nous passons en revue les mĂ©canismes de perception de la profondeur grĂące Ă  la stĂ©rĂ©ovision. Nous abordons la notion de disparitĂ© et nous l'estimons grĂące Ă  des critĂšres gĂ©omĂ©triques. Ces critĂšres nous permettent de dĂ©terminer un rĂ©glage optimum du capteur stĂ©rĂ©oscopique. Nous montrons que le gradient de disparitĂ© peut ĂȘtre utilisĂ© pour la reconnaissance de visages. Nous Ă©tudions, dans le chapitre 2, les mĂ©thodes qui conduisent au calibrage des camĂ©ras. On peut ajouter Ă  cette Ă©tape un traitement de rectification des images. Cela permet de mettre en correspondance les lignes des images du couple stĂ©rĂ©o, et de travailler dans une dimension seulement. Le chapitre 3 aborde la partie traitement numĂ©rique qui permet la recherche des points en correspondance ou points homologues. Nous passons en revue les principales mĂ©thodes dĂ©veloppĂ©es pour la constitution de cartes de profondeur denses. Des tests comparatifs sont rĂ©alisĂ©s avec une sĂ©rie de visages. Nous en dĂ©duisons la mĂ©thode appropriĂ©e pour une modĂ©lisation de visages temps-rĂ©el. Nous proposons dans le chapitre 4, une implantation temps-rĂ©el, basĂ©e sur une approche hybride permettant d'envisager un traitement embarquĂ©. Une version optimisĂ©e de l'algorithme de mise en correspondance est proposĂ©e. Enfin, nous dĂ©taillons les structures matĂ©rielles pour rĂ©aliser la chaĂźne algorithmique en temps-rĂ©el.DIJON-BU Sciences Economie (212312102) / SudocSudocFranceF

    Definition of

    No full text
    a model-based detector of curvilinear region
    corecore